ارتقای کیفیت دسته بندی متون با استفاده از کمیته دسته بند دو سطحی

نویسندگان

سعید جلیلی

علی اکبر صدری

چکیده

امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دسته بندی خودکار اهمیت وی‍‍ژه ای یافته است. روش های معمول در این زمینه، روش های یادگیری ماشین هستند. روش های بر اساس کمیته کارایی بهتری نسبت به سایر روش ها از خود نشان داده اند. در این مقاله، دو ایده در زمینه کمیته های دسته بند ارائه شده است. ایده اول برمبنای کمیته bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعه ای از مجموعه سندهای آموزشی، ساخته می شوند، ارائه شده است. بر اساس این ایده، ابتدا مجموعه آموزش با یک روش خوشه بندی به چند خوشه، بر اساس مشابهت یا عدم مشابهت کلاس های اسناد آموزشی، تقسیم می شود و سپس از روی هر خوشه از اسناد، یک دسته بند ساخته شده و به عنوان عضو کمیته قرار داده می شود (روش یادگیری اعضای کمیته یکسان است). در ایده دوم ساخت کمیته ای دو سطحی مطرح شده است. در این ایده اعضای کمیته های سطح دوم خود کمیته هایی هستند که بر مبنای ایده اول ساخته می شوند. در ارزیابی ایده اول مشخص شد که افزایش کارایی بر مبنای معیار دقت و معیار بازخوانی در کمیته بیزین ساده نوع اول، بیشتر از سایر کمیته های نوع اول بوده و به ترتیب 12 درصد و 1/5 درصد می باشد. ارزیابی ها در کمیته نوع دوم (برمبنای ایده دوم)، افزایش کارایی را نسبت به کمیته نوع اول نشان می دهند که بیشترین آن نسبت به کمیته rocchio نوع اول بوده، که معیار دقت را در حدود 8/3 درصد و معیار بازخوانی را در حدود 8/18 درصد افزایش داده است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می گیرد. این موضوع می تواند در قالب یک ی...

متن کامل

ارتقای کیفیت دسته‌بندی متون با استفاده از کمیته‌ دسته‌بند دو سطحی

امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دسته‌بندی خودکار اهمیت وی‍‍ژه‌ای یافته است. روش‌های معمول در این زمینه، روش‌های یادگیری ماشین هستند. روش‌های بر اساس کمیته کارایی بهتری نسبت به سایر روش‌ها از خود نشان داده‌اند. در این مقاله، دو ایده در زمینه کمیته‌های دسته‌بند ارائه شده است. ایده اول برمبنای کمیته‌ bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعه‌ای از مجموعه سنده...

متن کامل

دسته بندی پرسش ها با استفاده از ترکیب دسته بندها

هدف از تولید و گسترش سیستم های پرسش و پاسخ، ایجاد پاسخ دقیق برای پرسش داده شده به زبان طبیعی می باشد. یکی ازمهم ترین بخش های سیستم های پرسش و پاسخ دسته بندی پرسش است. عمل دسته بندی پرسش، پیش بینی نوع پاسخ مورد نیاز برای پرسش داده شده به زبان طبیعی می باشد. کارهای انجام شده در این زمینه را می توان در دو دسته ی مبتنی بر قانون و مبتنی بر یادگیری تقسیم کرد. در این مقاله برای دسته بندی پرسش ها، از ی...

متن کامل

ارتقای کیفیت دسته‌بندی متون با استفاده از کمیته‌ دسته‌بند دو سطحی

Nowadays, the automated text classification has witnessed special importance due to the increasing availability of documents in digital form and ensuing need to organize them. Although this problem is in the Information Retrieval (IR) field, the dominant approach is based on machine learning techniques. Approaches based on classifier committees have shown a better performance than the others. I...

متن کامل

ارائه روشی کارا برای دسته بندی مسائل چنددسته ای با رویکرد انتخاب دسته بند

سیستمهای دسته بندی شورایی، رویکردی مؤثر در یادگیری ماشین است که در آن با ترکیب نتایج چند دسته بند سعی می شود تقریب بهتری از یک دسته بند بهینه فراهم شود. در حوزه ترکیب خروجی شورای دستهبندها، رویکرد «انتخاب دستهبند» توجه کمتری را در مقایسه با رویکرد «ادغام دسته بند» به خود جلب کرده است. همچنین، اغلب روشهای موجود در این حوزه، هزینه محاسباتی بالایی دارند. در این مقاله، روشی مؤثر در دسته بندی مسائل ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
نشریه دانشکده فنی

ناشر: دانشکده فنی

ISSN 0803-1026

دوره 41

شماره 7 2007

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023